Mise en qualité de la donnée
Depuis l'environnement Bac à Sable ou sandbox des outils de mise en qualité des données sont mis à disposition :
- Datapipeline
- Dataiku (en option)
La mise au point de traitements (pour la mise en qualité des données par exemple) est réalisée avec l'outil Datapipeline : Liste des fonctions ou Dataiku : Liste des fonctions.
Des espaces de stockage dédiés au Bac à Sable sont créés par l'Administrateur données. Ces espaces distincts de ceux de production, sont accessibles en lecture et écriture depuis le Bac à Sable.
Depuis l'environnement du Bac à Sable, il est également possible de lire des données de production. Depuis l'environnement du Bac à Sable, il est également possible de lire et écrire des données de l'EID.
Tous les espaces de stockage utilisés dans le Bac à Sable doivent être créés au préalable.
Le Bac à Sable est accessible aux utilisateurs métiers en fonction de leur rôle métier.
Alimentation des données
Le datascientist peut utiliser des EdS déjà existants et il peut également demander au superviseur de données la création d'espaces de stockage dédiés au Bac à Sable pour des besoins spécifiques.
Si le data scientist a besoin d'utiliser des données qui ne sont pas encore dans le socle, il utilise le composant Data Ingestion pour alimenter un espace auquel l'Administrateur données lui a donné accès.